本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。(使用时尽量注明...
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。(使用时尽量注明...
文本分类语料,共9833篇文档;train为训练语料,test为测试语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分;
复旦大学中文文本分类语料.xlsx
标签: 中文文本分类
中文文本分类语料库
中文文本分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料...
复旦大学谭松波中文文本分类语料库,资源免积分下载,仅供大家学习使用,这个数据集到底怎么用我也没试过。
复旦大学谭松波中文文本分类语料库 中文文本分类语料(复旦大学)-训练集和测试集。测试语料共9833篇文档;训练语料共9804篇文档。
文本分类语料库(复旦)训练语料,本语料库由复旦大学李荣陆提供,共9804篇文档,两个预料各分为20个相同类别。
文本分类语料库(复旦)测试语料 由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少...
编码格式为GBK。 是网上流传的测试集和训练集的合并版。 用户获取后要自行清洗语料。
以复旦中文文本分类语料库为样本,用python实现的文本分类算法 由于训练集和测试集太大,所以给出的是训练集和测试集的下载地址,以及停用词表hlt_stop_words.txt Python版本为2.7 运行顺序: step1:corpus_segment...
复旦谭松波的,别人辛苦整理,免费发布的东西,拿过来自己赚积分,绝了 数据说明 answer.rar为测试语料,共9833篇文档; train.rar为训练语料,共9804篇文档,分为20个类别。 训练语料和测试语料基本按照1:1的比例来...
中文文本分类语料(复旦)训练集+测试集(100M)完整版
1、资源中有语料,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时...
复旦中文文本分类数据集,包含训练集和测试集,自然语言处理 看论文看到数据堂的复旦中文文本分类语料无法下载,网上找到了训练集和测试集,4积分,良心价
NLP文本分类语料库(复旦)语料训练集
标签: 文本分类
训练集
中文文本分类语料-测试集下载 是测试集,训练集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。...
人工智能-深度学习-tensorflow
资料包里面含有完整版的复旦大学语料库,外加上本人针对这个语料库而收集整理的分词表,还包括本人精选10类各100篇,以及对其进行分词后的文件,以及只筛选名词后的文件
文本分类语料库(复旦)的测试语料库是一个被压缩成rar格式的文件,主要用于文本分类任务的测试和评估。该语料库由复旦大学计算机科学与技术学院提供。 train.rar文件包含了大量的文本样本,这些样本已经被预处理和...
文本挖掘与文本分类的概念 文本挖掘(Text Mining)是从一个非机构化文本信息中获取用户感兴趣或者有用的模式过程。文本挖掘的 7 个主要领域如下: 搜索和信息检索:存储和文本文档的检索,包括搜索引擎和文档的...
本语料库由复旦大学李荣陆提供。 train.zip共9804篇文档,test.zip共9832篇文档,都分为20个类别。 下载后可以自己重新切分数据,也可以直接用。 免费下载地址:链接:...
标签: 复旦;训练集
文本分类语料库(复旦)训练语料。很好很强大,欢迎下载
标签: 文本分类语料
复旦大学新闻语料库,该版本已转为UTF-8格式,包含训练集和测试集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
复旦大学中文文本分类训练集和测试集,all文件夹为复旦大学中文文本分类语料集,test_corpus为该语料集中挑选部分划分出来的,train_corpus为该语料集中挑选test_corpus后剩余部分划分出来的。下载以后可以按照自己...
文本分类 原项目地址:https://github.com/FudanNLP/nlp-beginner 感谢教师:邱锡鹏 微博:@邱锡鹏 1 文本分类任务简介 在有监督学习中,需要提供一组有类别标记的样本用来学习模型以及检验模型的好 坏。这组样本...
复旦中文文本分类数据集,包含训练集和测试集,自然语言处理 看论文看到数据堂的复旦中文文本分类语料无法下载,网上找到了训练集和测试集,4积分,良心价 相关下载链接://download.csdn.net/download/zhangzc12409...
这是我通过改进他人的算法,对中文复旦大学语料库的文本做文本分类的项目。 也是我第一次独立进行中文文本分析的小DEMO。 项目源码在这里: https://github.com/yingdajun/ML_Text_Classifiaction
复旦大学谭松波中文文本分类语料库资源